最新视频 【Nicorgi's Bug Log】我与model.eval()与BatchNorm的恩怨情仇【Nicorgi's Bug Log】我与model.eval()与BatchNorm的恩怨情仇
最新视频 你知道用什么指标评价一个大模型的好坏吗?PPL,MMLU,MATH,GPQA,BBH,IF-EVAL,MMLU-PRO你知道用什么指标评价一个大模型的好坏吗?PPL,MMLU,MATH,GPQA,BBH,IF-EVAL,MMLU-PRO
最新视频 CCL 2024 | 评测专题论坛 | System Report for CCL24-Eval Task 5: Multi-Model Classical CCCL 2024 | 评测专题论坛 | System Report for CCL24-Eval Task 5: Multi-Model Classical C